神经网络的量化与图优化

探讨编译器前端如何将浮点数（FP32）模型转换为定点数（INT8/INT4）模型，减少内存占用并适配没有 FPU 的边缘设备。

Last modified: 2026-05-24